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摘 要 : [目的 /意义 ] 考 虑 用 户 兴趣 和 社交 关系 两 方面 的 动态 变化 ,提出 融合 用 户 动态 兴趣 与 社交 关系 的 学 者 推荐 模型 。 
[ 方法/ 过程] 首先 ,利用 不 同学 科 的 期 刊 文献 作为 分 类 语 料 , 基 于 Labeled-LDA 模型 对 学 者 所 发 博文 进行 学 科 领 


域 判别 。 
态 兴 趣 相 似 度 ;根据 学 者 间 链 接 的 数量 关系 计算 学 


然后 ,依据 KNN 算法 对 博文 进行 学 科 分 类 ,接着 利用 学 科 兴 趣 变 化 速率 改进 时 间 因 子 , 计 算得 到 学 者 动 
者 的 PageRank 值 ,结合 学 者 所 发 博文 的 时 间 价 值 计 算得 到 全 局 
信任 度 。 在 学 者 评论 、 推 荐 交互 行为 中 引入 时 间 权 重 计算 学 者 交互 信任 度 ， 

者 的 动态 社交 信任 度 。 最 后 ,融合 兴趣 相似 度 与 信任 度 进 行 学 者 推 荐 。[ 结果 


综合 全 局 信任 度 和 交互 信任 度 得 到 学 
/结论 ] 虚 拟 学 术 社 区 中 融合 用 户 动 


态 兴趣 与 社交 关系 的 学 者 推荐 模型 从 动态 兴趣 和 动态 社交 关系 两 个 视角 出 发 ,能够 有 效 提高 学 者 推荐 的 质量 。 
3 虚拟 学 术 社 区 动态 兴趣 ”社交 关系 ”学 者 推荐 Labeled-LDA 主题 模型 
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me 
于 3021 年 12 月 ,我 国 网 民 规 模 达 10.32 亿 , 即 时 通信 
用 将 规模 达 10. 07 亿 , 社 交 网 络 已 经 成 为 人 们 通信 交 


演 上 的 重要 渠道 "， 。 随 着 社交 网 站 的 广泛 应 用 ,各 种 各 
oe t 同 兴 CR 

共 。 在 虚拟 社区 中 ， 
EE 
现 用 户 之 间 的 头脑 风暴 ,融合 个 体 用 户 的 知识 与 智 


量 急速 增 长 ,为 用 户 寻 找 与 自己 研究 兴趣 相投 的 学 者 
带 来 了 很 多 阻碍 ,很 多 研究 者 以 学 者 兴趣 特征 为 基础 ， 
融合 多 维度 属性 进行 了 学 者 推荐 研究 ,其 中 部 分 研究 
者 注意 到 了 学 者 研究 兴趣 或 社交 关系 的 动态 变化 ， 
很 少 有 研究 同时 考虑 兴趣 与 社交 关系 两 者 的 动态 

化 。 因 此 ,本 文 提 出 一 种 融合 用 户 动 态 兴 趣 与 社交 闫 
系 的 学 者 推荐 模型 ,该 模型 利用 学 科 兴 趣 变化 速率 改 
进 时 间 因 子 , 将 时 间 因 子 引 入 学 者 的 博文 相似 度 和 社 
交 信 任 度 计算 中 ,同时 考虑 了 学 者 在 兴趣 和 社交 行为 
两 方面 的 动态 变化 ,有 效 提 高 学 者 推荐 的 准确 性 。 


2 ”相关 研究 


RS 一 般 的 综合 性 或 大 众 化 虚拟 社区 存在 用 户 
纷 杂 ,成 员 流 动 性 大 ,传播 的 信息 内 容 \ 形 式 .质量 不 一 
et tt ee 4 
康 社区 ' .虚拟 学 术 社 区 "等 开始 出 现 ,它们 将 具有 共 
同 兴趣 和 特定 领域 知识 的 用 户 聚 集 在 一 起 ,交流 专业 
知识 和 经 验 ” ” 。 虚 拟 学 术 社区 作为 典型 的 专业 虚拟 
社区 ,其 以 科研 工作 者 为 服务 对 象 ,支持 科研 人 员 知 识 
享 和 维护 社交 关系 '” ,研究 显示 虚拟 学 术 社 
高 学 者 的 学 术 曝 光 率 ,促进 新 知识 的 产 


交流 . 共 
区 能 够 有 效 提 
生 和 传播 ”… 。 

然而 , 随 着 虚拟 学 术 社 区 的 快速 发 展 ,学 术 信息 数 


当前 ,基于 用 户 兴趣 挖掘 推荐 研究 的 视角 已 经 从 
关注 用 户 的 静态 兴趣 向 动态 兴趣 转变 。 国 内 围绕 用 户 
动态 兴趣 推荐 的 研究 已 在 数字 图 书馆 、 微 博 社 区 、 知 识 
服务 等 领域 有 所 探讨 。 潘 家 武 ” 运用 领域 本 体 构建 
数字 图 书馆 的 动态 用 户 兴趣 模型 ,将 实时 获取 的 用 户 

兴趣 信息 与 领域 本 体 库 进 行 匹配 修正 ,以 匹配 的 方式 
满足 用 户 个 性 化 的 需求 ; 陶 永 才 等 "提出 一 种 基于 加 
权 动 态 兴 趣 度 (Weighted Dynamic Degree of Interest ， 
WDD1) 的 微 博 个 性 化 推荐 模型 ,WDDI 模型 在 微 博 转 
发 特征 中 引 和 时间 因子 ,从 而 建立 面向 用 户主 题 的 个 
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体 动态 兴趣 模型 ,另外 通过 用 户 与 其 关注 用 户 的 相似 
度 和 交互 频率 获取 用 户 的 群体 动态 兴趣 ,将 用 户 个 体 
兴趣 与 群体 兴趣 加 权 结 合 得 到 加 权 动 态 主题 兴趣 模 
型 ;应 吏 等 中 从 用 户 知识 范畴 的 获取 、 知 识 关联 挖 气 
及 动态 知识 演化 角度 测度 用 户 兴趣 随时 间 的 推移 而 表 
现 出 的 知识 概念 漂移 及 变化 趋势 。 部 分 学 者 将 动态 兴 
趣 与 社交 关系 结合 进行 推荐 , 王 占 等 25 利用 时 间 遗 忘 
函数 模拟 用 户 的 兴趣 变化 ,然后 将 信任 关系 和 兴趣 变 
化 融和 人 到 协同 过 滤 推 荐 中 ; 王 维 等 5 融入 艾 宾 浩 斯 遗 
忘 图 数 的 Pearson 相关 系数 以 计算 用 户 间 的 兴趣 相似 
度 , 通 过 加 权 融 合 获取 用 户 信任 与 用 户 兴趣 间 的 关联 
关系 ,以 获取 更 加 准确 的 最 近邻 居 。 

在 国外 的 动态 兴趣 研究 中 ,H. Feng 等 ”基于 时 
间 提 权 关联 规则 的 时 间 重 短 群 体 算法 来 模拟 用 户 的 兴 
下 寅 化 ,克服 了 用 户 兴趣 漂移 导致 推荐 效果 不 好 的 问 
题 EX. J， Liu 等 引入 时 间 豪 减 函 数 来 反映 用 户 的 
兴 亚 变化 , 并 使 用 改进 的 相似 度 模型 进行 推荐 。S. 
PaESemum 等 "在 电子 学 习 推荐 系统 中 将 数据 流 偏好 
划 综 到 大 小 相等 的 窗口 中 ,并 随时 间 变化 对 用 户 兴 
主 静 ,能 够 有 效 提高 内 容 推荐 的 效率 和 准确 性 。 也 有 
必 部 分 研究 将 兴趣 的 动态 变化 与 社交 关系 相 结 合 ,如 
CCRu 等 "将 直接 和 间接 信任 关系 、 用 户 偏好 签到 时 
阅 神 地 理 位 置 融合 到 矩阵 分 解 模型 中 进行 兴趣 推荐 。 
.会 综 上 所 述 , 目 前 学 者 们 有 关 个 性 化 推荐 研究 的 视 
角 放 经 从 关注 用 户 的 静态 属性 转向 动态 属性 ,部 分 研 
究 穿 别 对 用 户 兴趣 和 社交 关系 的 动态 性 有 所 考虑 , 研 
究 志 户 的 兴 亚 迁移 能 够 发 现 用 户 的 近期 兴趣 ,研究 社 
交 轿 为 的 动态 性 能 够 描述 用 户 之 间 近 期 的 社交 关系 ， 
学 者 在 研究 兴趣 和 社交 关系 两 个 维度 时 考虑 时 间 因 
素 ,兼顾 了 虚拟 学 术 社 区 的 学 术 性 与 社交 性 ,但 很 少 有 
研究 同时 考虑 动态 兴趣 与 动态 社交 关系 。 另 外 ,目前 


数据 采集 与 预 处 理 


分 类 训练 语 料 
博文 内 容 


学 者 基本 信息 
ear 7 

学 术 领 域 博文 

博文 学 科 分 类 
学 科 -时 间 因 子 计算 

动态 兴趣 矩阵 


动态 兴趣 相似 度 


关于 动态 性 的 研究 ,主要 是 利用 遗忘 函数 计算 时 间 权 
重 ,学 科 资 源 本 映 的 老化 速度 带 来 的 兴趣 变化 速率 也 
较 少 考虑 。 因 此 ,本 文 提出 了 一 种 融合 用 户 动 态 兴 
与 社交 关系 的 学 者 推荐 模型 ,该 模型 首先 利用 不 同学 
科 的 期 刊 文献 作为 分 类 语 料 , 基 于 Labeled-LDA 模型 
对 学 者 所 发 博文 进行 学 科 领 域 判 别 ,然后 利用 KNN 算 
法 对 博文 进行 学 科 分 类 ;接着 利用 学 科 资 源 的 老化 速 
度 来 表示 学 者 对 某 学 科 兴 趣 变化 的 速率 ,利用 学 科 兴 
趣 变 化 速率 改进 学 者 发 表 每 篇 博文 的 时 间 因 子 ;将 改 
进 后 的 学 科 -时 间 因 子 引入 学 者 博文 主题 矩阵 得 到 学 
者 动态 兴趣 和 矩阵 ,然后 计算 得 到 学 者 动态 兴趣 相似 度 。 
在 学 者 信任 度 计算 中 ,利用 学 者 间 链 接 的 数量 关系 计 
算 学 者 的 PageRank 值 ,结合 学 者 所 发 博文 的 时 间 价 值 
计算 得 到 全 局 信任 度 ; 在 学 者 评论 ,推荐 交互 行为 中 引 
入 时 间 权 重 计算 学 者 交互 信任 度 , 综 合 全 局 信任 度 和 
交互 信任 度 得 到 学 者 的 动态 社交 信任 度 。 最 后 通过 实 
验 找到 最 合理 的 权重 分 配 ,融合 兴趣 相似 度 与 社交 信 
任 度 计算 学 者 最 终 推荐 评分 ,选取 分 数 最 高 的 Top-K 
学 者 进行 推荐 。 

3 ”融合 用 户 动 态 兴趣 与 社交 关系 的 学 者 
推荐 模型 


随 着 时 间 的 迁移 ,虚拟 学 术 社 区 中 产生 了 大 量 的 
用 户 社 交行 为 和 学 术 信 息 ,考虑 学 者 在 不 同时 间 的 兴 
趣 变化 和 交互 行为 ,可 以 更 准确 及 时 地 反映 学 者 当前 
的 兴趣 和 社交 关系 ,提高 学 者 推荐 效果 。 本 文 提出 的 
融合 用 户 动态 兴趣 与 社交 关系 的 虚拟 学 术 社 区 中 学 者 
推荐 模型 包括 4 个 模块 ,分 别 是 数据 采集 与 预 处 理 模 
块 ,学 者 动态 兴趣 模块 .学 者 动态 社交 模块 和 学 者 推荐 
模块 。 如 图 1 所 示 : 


学 者 推荐 


推荐 评分 标准 化 
处 理 


-> 


学 者 推荐 评分 


Top-K 学 者 推荐 


图 1 融合 用 户 动态 兴趣 与 社交 关系 的 学 者 推荐 模型 
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(1) 数 据 采集 与 预 处 理 模块 。 首 先 采集 虚拟 学 术 
社区 中 相关 学 者 数据 ,并 采集 相关 学 科 的 期 刊 文献 数 
据 作为 博文 分 类 语 料 ,然后 ,对 数据 进行 去 重 、 缺 失 值 
处 理 得 到 学 者 基本 信息 .博文 信息 和 社交 信息 ,以 及 期 
刊 文献 的 摘要 .关键 词 等 。 

(2) 学 者 动态 兴趣 模块 。 利 用 不 同学 科 的 期 刊 广 
献 作为 分 类 语 料 ,基于 Labeled-LDA 模型 对 学 者 所 发 
博文 进行 学 科 领 域 判别 ,然后 利用 KNN 算法 对 博文 进 
行 学 科 分 类 ;学 者 对 某 学 科 的 研究 兴趣 可 以 表现 为 对 
该 学 科 资 源 的 利用 情况 ,而 学 科 资 源 的 利用 情况 可 以 
通过 该 学 科 的 资源 老化 情况 来 衡量 ,因此 ,可 以 利用 学 
科 资 源 的 老化 速度 来 表示 学 者 对 该 学 科 兴 趣 变化 的 速 
率 , 然 后 利用 学 科 兴 趣 变化 速率 改进 学 者 发 表 每 篇 博 
美的 时 间 因子 ;将 改进 后 的 学 科 -时间 因子 引入 学 者 
文 主题 矩阵 ,加 权 平 均 得 到 学 者 动态 兴趣 特征 向 量 ， 
最 局 利用 余弦 相似 度 计算 用 户 动 态 兴趣 相似 度 。 
人 (3 ) 学 者 动态 社交 模块 。 学 者 动态 社交 通过 社交 
停 重度 来 表示 ,在 信任 度 计算 中 ,利用 学 者 间 链 接 的 数 
量 闫 系 计 算 学 者 的 PageRank 值 , 结 合 学 者 所 发 博文 的 
时 天 价值 计算 得 到 全 局 信任 度 ;在 学 者 评论 .推荐 交互 
入 党 中 引入 时 间 权重 计算 学 者 交互 信任 度 ,综合 全 局 
信和 盆 度 和 交互 信任 度 得 到 学 者 的 动态 社交 信任 度 。 
SC) 学 者 推荐 模块 。 通 过 实验 找到 最 合理 的 权重 
分 一, 融合 学 者 动态 兴趣 相似 度 和 动态 社交 信任 度 进 
乔 红 天 评分 ,选取 分 数 最 高 的 Top-K 学 者 推荐 给 目标 
用 和 。 
3: 世 基于 用 户 动态 兴趣 的 相似 度 计算 
3.E1 学 科 分 类 语 料 构建 

根据 邱 均 平等 的 研究 ,参照 图 书 情报 领域 学 者 
跨 学 科研 究 的 前 20 个 学 科 领 域 ,本 文选 择 了 图 书 情报 
学 .计算 机 科学 .新闻 学 与 传播 学 .高 等 教育 学 .生物 信 
息 学 .管理 科学 与 工程 6 个 学 科 领 域 的 学 者 作为 研究 
对 象 。 不 同 于 文献 数据 库 中 学 者 的 期 刊 论文 ,学 者 在 
虚拟 学 术 社区 中 生成 的 内 容 可 能 存在 生活 分 享 .话题 
讨论 等 非 学 术 性 内 容 ,同一 个 学 者 也 可 能 发 表 涉 及 不 
同学 科 的 内 容 ,不 能 仅 通 过 学 者 所 属 学 科 类 别 判定 博 
文学 科 , 所 以 需要 对 博文 进行 学 术 信息 识别 和 学 科 分 
类 ,本 文 从 CNKI 中 采集 选 定 学 科 的 核心 期 刊 文献 摘 
要 和 关键 词 等 信息 作为 分 类 语 料 ,将 期刊 文献 的 所 属 
学 科 作为 分 类 标签 。 
3.1.2 主题 特征 提取 

本 文 利用 Labeled-LDA 模型 同时 对 有 标记 的 期 乔 
文献 和 未 标记 的 博文 进行 主题 特征 提取 ,得 到 博文 文 


档 向 量 和 期 刊 文档 向 量 ,Labeled-LDA 模型 是 D. Ram- 
age 等 ”于 2009 年 在 LDA 模型 的 基础 上 提出 的 一 种 
有 监督 的 主题 模型 ,其 主要 用 于 对 有 标签 的 文档 进行 
建 模 ,与 LDA 模型 相 比 ,Labeled-LDA 模型 多 出 一 层 为 
每 篇 文档 附加 的 类 别 标签 A, 运用 某 篇 文章 是 否 属于 
一 个 标签 类 别 (A 值 ) 来 约束 文档 的 主题 概率 分 布 (0 
值 )。 在 选择 一 个 词 的 时 候 ,LDA 模型 是 在 所 有 的 主 
题 上 选择 该 词 ,而 Labeled-LDA 模型 则 是 只 从 文档 相 
关 的 标签 所 对 应 的 主题 中 去 选择 ,避免 了 词 在 所 有 主 
题 上 的 分 配 ,将 词 的 主题 范围 限定 在 所 属 文档 标记 的 
主题 之 内 ,很 好 地 利用 了 人 工 标 记 的 主题 信息 ,可 
以 避免 文档 在 不 对 应 的 分 类 上 进行 强制 分 配 的 缺陷 ， 


如 图 2 所 示 : ro 
of 
各 


图 2 Labeled-LDA 模型 


其 中 ,M 代表 文档 集合 ,K 代表 主题 总 数 ,N 是 每 
篇 文章 中 含有 的 总 词 数 , 隐 变 量 Z 表示 某 一 个 主题 ,W 
是 文本 的 单词 ,0 为 文本 - 主题 概率 分 布 ,9 为 主题 - 
语词 概率 分 布 ,参数 w 和 BB 分 别 是 9 和 的 超 参 数 ,A 
是 某 篇 文章 的 学 科 标 和 类别。 
3.1.3 博文 学 科 分 类 

本 文 利用 平均 主题 相关 度 阔 信 规则 判别 博文 是 
属于 选 定 学 科 领 域 ,将 Labeled-LDA 主题 模型 训练 得 到 
的 博文 文档 向 量 和 期 刊 文档 向 量 分 别 记 为 0.(i=1,2， 
… ,ND (为 博文 数 ) 和 (=1,2,…,M) (4 =1,2,…， 
7) (1M 为 某 学 科 的 期 刊 文献 数 ,为 学 科 数 ) ,计算 博文 
与 学 科 领 域 { 的 平均 主题 相关 度 呈 ,如 公式 (1) 所 示 : 
Tt 


加 


其 中 ,Djs(i,7) 是 90, 和 和 bi 的 Jensen-Shannon 散 度 ， 
M 为 学 科 的 期 刊 文献 数 ,0 < 5; <1,5; 的 值 越 高 说 明 
博文 i 与 这 个 学 科 领 域 平均 主题 越 相似 ,由 此 可 以 对 
学 者 所 发 博文 进行 学 科 领 域 判 别 。 

在 完成 学 科 领 域 博文 选取 后 ,为 了 提升 分 类 准确 
性 ,本 文 利用 KNN 算法 对 博文 进行 学 科 分 类 。 
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3.1.4 ”学 者 的 动态 兴趣 相似 度 计算 

学 者 研究 兴趣 的 动态 变化 与 人 类 大 脑 的 遗忘 过 程 
较为 相似 ,因此 根据 学 者 不 同 阶段 发 表 的 博文 ,采用 模 
拟 遗 忘 函数 来 模拟 学 者 的 兴趣 变化 。 

引入 时 间 因 子 W(w,i) ,作为 学 者 不 同时 期 研究 兴 
趣 的 权重 ,如 公式 (2) 所 示 : 
W(u,i) =1/ev™ 公式 (2) 

其 中 4 为 与 当前 待 加 权 博 文 i 对 应 的 时 间 (4%, < 
5 < ti ) ,ti 表示 学 者 最 新 一 篇 博文 对 应 的 时 间 ,t, 表 
示 学 者 最 早 一 篇 博文 对 应 的 时 间 ,1, 的 值 越 大 ,表示 多 
(wi) 的 值 越 大 (e-!<W(u,i) <1) ,说 明 该 博文 的 发 
表 时 间 越 近 , 分 配 的 权重 越 大 , 越 能 代表 该 学 者 当前 的 
兴趣 1。a 为 学 科 兴趣 变化 速率 ,对 于 不 同学 科 领 域 
而 时 ,博文 老化 的 速度 是 不 相同 的 59 ,a 的 值 越 小 , 表 
示 旬 者 对 该 学 科 资源 兴趣 变化 的 速度 越 慢 , 相 较 于 其 
信和 部 科 同 一 时 间 发 布 的 博文 ,该 学 科 博 文 分 配 的 权重 
越 大 , 越 能 代表 该 学 者 当前 的 兴 
己 网 络 信息 的 老化 符合 负 指数 函 数 如 公式 (3) 
所 床 : 


Chl 公式 (3) 
其 中 4 表示 信息 发 布 的 时 间 ,i 表示 当前 的 时 间 ,C 


其 中 x 表示 学 者 第 i(i=1,2,…,g) 篇 博文 在 主题 
j 下 的 概率 ,WW(w,i) 表示 学 者 第 i(i =1,2,…,g) 篇 博 
文 的 时 间 权 重 。 

最 后 利用 余弦 相似 度 计算 学 者 动态 兴趣 相似 度 ， 
如 公式 (8 ) 所 示 : 


> 1 ZX0 
sim(u,v) =cos(u,v) = 一 一 
V Ew x MEY 
公式 (8) 
式 中 ,学 者 u 和 学 者 v 分 别 用 (wi ,ws,… ,uw,) 和 


(v1,V,，… ,V0 ) 表示,n 表示 所 有 主题 数 ;u, 和 vw 分 别 表 
示 学 者 u 与 学 者 v 在 第 j 个 主题 下 的 动态 向 量 值 。 
3.2 ”基于 用 户 动态 社交 关系 的 信任 度 计算 

社交 网 络 中 用 户 间 的 关系 可 以 划分 为 全 局 关系 和 
交互 关系 ,全 局 关系 表示 用 户 在 全 局 网 络 中 的 信誉 和 
影响 力 ,用 全 局 信任 度 表示 ,交互 关系 表示 两 两 学 者 之 
间 的 互动 行为 ,用 交互 信任 度 表 示 ' 。 
3.2.1 学 者 全 局 信任 度 计算 

学 者 的 全 局 信任 度 可 以 通过 学 者 在 全 局 信任 网 络 
中 的 声誉 和 影响 力 来 衡量 ,比较 具有 代表 性 的 算法 是 
PageRank 算法 ,PageRank 算法 是 谷歌 在 搜索 引擎 结果 
中 用 于 对 网 站 进行 排名 的 算法 ,其 核心 思想 是 网 页 的 
重要 性 通过 其 他 网 页 对 其 链接 的 数量 衡量 ,然而 


( 饼 ) 表 未 信息 在 % 时 刻 的 影响 力 大 小 ,a 代表 的 是 信息 
的 老化 率 系数 ,化 简 公式 (3) 计算 老化 系数 am ,如 公式 
对 所 示 


(CD)) 
本 t,t; 


bd 


”> 


公式 (4) 
己 当 C(t) =1/2 时 , -6 实际 是 信息 的 半衰期 , 记 
为 中 根据 半衰期 的 定义 ,信息 的 半衰期 是 指 信息 自 被 发 
布 的 时 刻 开始 到 信息 的 利用 率 下 降 到 一 半 的 时 刻 之 间 的 
时 间 段 , 即 信息 的 影响 力 减 半 的 时 间 , 这 里 用 某 学 科 所 有 
博文 T 的 平均 值 表示 该 学 科 的 博文 半衰期 7, 如 公式 (5) 
所 示 : 


之 公式 (5) 


T= 


PageRank 仅 考 虑 了 网 站 网 页 间 链 接 的 数量 关系 ,并 不 
对 其 本 身价 值 进 行 分 析 ”。 所 以 本 文 结合 学 者 好 友 
关系 和 所 发 博文 的 价值 进行 分 析 ,一 方面 发 气 学 者 在 
整个 虚拟 学 术 社 区 中 的 影响 力 , 男 一 方面 衡量 学 者 所 
发 布 博文 的 价值 。 

本 文 首先 借鉴 PageRank 的 算法 思想 ,将 该 算法 中 
的 网 页 链接 关系 换 成 学 者 链接 关系 计算 得 到 学 者 的 
PageRank 值 ,然后 计算 学 者 所 发 博文 的 价值 。 学 术 文 
献 的 价值 可 以 用 期 刊 级 别 \ 发 表 时 间 、 被 引用 情况 等 
衡量 ” ,而 网 络 信息 更 注重 时 效 性 。 本 文通 过 计算 博 
文 的 时 间 价 值 来 体现 博文 的 使 用 价值 ”。 将 学 者 的 
PageRank 值 和 学 者 所 发 博文 的 价值 相 结 合 ,计算 得 到 


其 中 为 该 学 科 博 文 数 ,7(i) 为 博文 i 的 半衰期 ， 

即 博 文 从 发 布 到 评论 数 达 到 一 半 的 时 间 , 最 后 根据 公 

式 (6) 计 算出 某 学 科 博 文 的 老化 系数 a。 

= -和 公式 (6) 

学 者 动态 兴趣 向 量 可 以 表示 为 User = (FF ,FF,,… 

忆 ) ,其 中 (j=1,2,…n) 对 应 为 学 者 在 第 j 个 主题 上 
的 动态 向 量 值 ,如 公式 (7) 所 示 : 

F,= 2ox,W(u,i)/g 


公式 (7) 


学 者 全 局 信任 度 ,如 公式 (9) 所 示 : 
D(u) =PR(u) + 52°" 公式 (9) 

其 中 PR(u) 为 学 者 的 PageRank 值 ,7 为 博文 学 
科 半 衰 期 ,由 公式 (5 ) 计 算得 到 ,t; 表示 博文 i 的 产 出 
年 龄 ,q 表示 学 者 u 产 出 的 博文 数 ,2 “表示 学 者 u 第 i 
篇 博文 的 价值 。 
3.2.2 学 者 交互 信任 度 计 算 

不 同 于 全 局 信任 关系 ,学 者 交互 信任 度 是 要 计算 
两 两 学 者 之 间 的 信任 度 ,可 以 通过 学 者 之 间 的 历史 交 
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互 行为 计算 学 者 交互 信任 度 ,同时 学 者 之 间 的 交互 行 
为 是 动态 变化 的 , 越 近 的 交互 行为 信任 权重 越 高 ” 。 
学 者 在 虚拟 学 术 社 区 中 的 交互 行为 主要 表现 为 对 学 者 
所 发 博文 的 点 赞 和 评论 。 

由 于 无 法 准确 获取 用 户 的 点 赞 时 间 , 所 以 点 赞 交 
互 行为 F(u,v) 没 有 考虑 时 间 权 重 ,如 公式 (10) 所 示 : 


人 公式 (10) 


其 中 ,B(u,v) 表 示 学 者 v 对 学 者 u 的 点 赞 数 ,g, 表 
示 学 者 v 的 点 赞 行为 数 。 

学 者 v 对 学 者 的 评论 行为 产生 的 交互 信任 度 G 
(u,v) 如 公式 (11) 所 示 : 
Guyv) = 3"L xw, 公式 (11) 
一 其 中 工 表示 第 j 年 度 的 评论 交互 信任 度 ,如 公式 
(1 台所 示 ,times, 表 示 第 j 年 度 学 者 v 的 评论 行为 数 ， 
,表示 第 j 年 度 用 户 v 对 用 户 u 的 评论 次 数 ,n 表 
8 评论 交互 持续 时 间 ,wj 表示 第 j 年 度 的 评论 交互 时 
间 权 重 ,如 公式 (13 ) 所 示 ,z 表示 当前 年 份 ,5 表示 评 
论 交 互 的 年 份 ,评论 交互 的 时 间 越 近 , 则 权重 越 大 。 


F(u,v) = 


times,, 公式 ( 12) 
”times, 
w=e™ 公式 (13) 


ON 综合 学 者 v 对 学 者 u 的 点 赞 交互 数 和 评论 交互 数 
计 狂 得 到 学 者 v 对 学 者 u 的 交互 信任 度 T(u,v) ,如 公 
式 k4) 所 示 : 
(ray) =oxFur)+(L-o)xZic(uv) 
:一 公式 (14) 
C0 上 中 ,0<w<1,F(u,v) 表 示 学 者 v 对 学 者 u 的 点 
赞 交互 信任 度 ,G(u,v) 表 示 学 者 v 对 学 者 u 的 评论 交 
互信 任 度 。 
3.2.3 ”学 者 动态 社交 信任 度 融 合计 算 

学 者 的 全 局 信任 度 反映 了 学 者 在 整个 虚拟 学 术 社 
区 中 的 影响 力 和 地 位 ,学 者 的 交互 信任 度 反映 了 学 者 
网 络 节点 间 的 交互 信任 度 。 对 全 局 信任 度 D(u) 和 交 
互信 任 度 T(u) 计 算 之 后 ,将 两 个 数值 进行 线性 加 权 得 
到 的 学 者 动态 社交 信任 度 Q(u) ,如 公式 (15) 所 示 : 

Q(u) =BxD(u) + (1-B) xT(u,0) 
公式 (15) 

在 公式 (15) 中 ,B 是 全 局 信任 度 D(u) 和 交互 信任 
度 T(u) 的 融合 参数 。 如 果 B > 0.5 ,表明 全 局 信任 度 
较 交互 信任 度 更 为 重要 ;如 果 B <0.5, 表 明 交 互信 任 
度 更 为 重要 ,本 文 设 定 参数 B =0.5, 即 认为 全 局 信任 
度 和 交互 信任 度 同 样 重要 。 


3.3 ”融合 用 户 动态 兴趣 相似 度 与 社交 信任 度 的 学 者 
推荐 

学 者 动态 兴趣 相似 度 反 映 了 学 者 动态 兴趣 倾向 ， 
学 者 的 动态 信任 度 反 映 了 学 者 在 整个 虚拟 学 术 社 区 中 
的 影响 力 和 地 位 以 及 学 者 之 间 点 对 点 的 交互 关系 。 对 
学 者 动态 兴趣 相似 度 sim(u,v) 和 动态 信任 度 Q(z) 计算 
之 后 ,将 两 个 数值 进行 线性 加 权 得 到 的 综合 数值 , 即 待 
推荐 学 者 的 推荐 评分 S, ,然后 根据 推荐 评分 向 目标 用 
户 进行 Top-K 学 者 推荐 。 最 终 推荐 评分 可 表示 如 下 : 

S =Y Xsim(u,v) +(1-y) xQ(u) 公式 (16) 

公式 (16) 中 ,Yy 是 学 者 动态 兴趣 相似 度 和 动态 信 
任 度 的 融合 参数 ,如 果 y > 0.5 ,表明 学 者 动态 兴趣 相 
似 度 较 动态 信任 度 更 为 重要 ;如 果 y<0.5, 表 明 动 态 
信任 度 更 为 重要 ,这 里 y 根据 实验 情况 设 定 。 


4 实证 分 析 


4.1 数据 收集 与 预 处 理 

为 了 对 该 推荐 模型 进行 验证 ,本 文 首 先 确定 了 6 
个 选 定 学 科 领 域 的 核心 期 刊 目录 ,然后 从 CNKI 中 采 
集 了 这 些 期 刊 2015 年 至 今 的 所 有 文献 信息 ,最 终 采集 
到 117 029 篇 文献 信息 ,6 个 学 科 领 域 的 核心 期 刊 目录 
及 文献 数 见 表 1。 

另外 ,利用 八 爪 鱼 疏 虫 工具 获取 科学 网 博客 2 汪 中 
6 个 学 科 领 域 学 者 的 博文 及 其 社交 信息 ,去 除 博 文 数 
量 或 好 友 数 量 为 0 以 及 隐私 设置 不 可 见 的 学 者 ,采集 
了 217 名 学 者 2015 - 2021 年 间 所 有 的 博文 信息 数据 
和 社交 数据 ,包括 博文 标题 .时间 .正文 .评论 .推荐 , 推 
荐 时 间 以 及 好 友 列 表 。 在 剔除 掉 不 完整 .无效 的 博文 
之 后 ,最 终 得 到 了 217 名 学 者 的 24 081 条 博文 以 及 博 
文 推荐 .评论 和 所 有 好 友 。 其 中 ,学 者 博文 数据 、 学 者 
评论 数据 .学 者 好 友 数 据 分 别 见 表 2、 表 3、 表 4。 
4.2 ”学 者 动态 兴趣 相似 度 计算 
4.2.1 文本 主题 特征 提取 

研究 首先 从 117 029 篇 期 刊 文献 中 随机 抽取 每 个 
学 科 领 域 5 000 篇 文献 作为 训练 语 料 ,然后 剔除 博文 
数据 集中 的 一 些 特 殊 字 符 后 ,利用 Python 中 NLPIR 
包 , 并 结合 停 用 词 表 与 用 户 自 定义 词典 ,对 学 者 博文 和 
期 刊 文献 摘要 进行 分 词 。 将 30 000 篇 带 有 6 个 不 同学 
科 标 签 的 期 刊 文献 和 24 081 篇 没有 标签 的 博文 加 入 
Labeled-LDA 模型 训练 , 主题 标识 即 学 科 标 签 , 得 到 主 
题 - 词 项 概率 分 布 以 及 文本 - 主题 概率 分 布 , 各 主题 
下 概率 最 大 的 10 个 词汇 见 表 5。 然 后 通过 公式 (1) 计 
算 博 文 与 各 个 学 科 领 域 的 平均 主题 相似 度 , 阔 值 设 定 
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为 0.5 ,最 终 得 到 22 938 篇 属于 6 个 学 科 领 域 的 博文 ，| 博文 所 属 的 学 科 类 别 。 
为 了 提升 分 类 准确 性 ,本 文 利 用 KNN 算法 进一步 确定 


表 1 核心 期 刊 目录 及 文献 数 单位 /篇 
到 书 情报 学 计算 机 科学 新 闻 学 与 传播 学 高 等 教育 学 生物 学 管理 科学 与 工程 
大 学 图 书馆 学 报 ,792 计算 机 辅助 设计 与 图 形 编辑 学 报 ,1 867 大 学 教育 科学 ,1 001 生物 工程 学 报 ,1 422 管理 工程 学 报 ,804 
情报 科学 ,2 356 学 学 报 ,1 702 编辑 之 友 ,1 641 高 等 工程 教育 研究 ， 生物 化 学 与 生物 物理 进 管理 科学 ,482 
情报 理论 与 实践 ,2 336 “计算 机 工程 ,4 136 出 版 发 行 研究 ,2 129 1 495 展 ,811 管理 科学 学 报 ,667 
情报 学 报 ,872 计算 机 工程 与 应 用 ， 当 代 传播 ,1 174 高 等 教育 研究 ,1 193 生物 技术 ,1 393 管理 评论 ,1 977 
情报 杂志 ,2 607 5 976 国际 新 闻 界 ,843 高 教 探索 ,2 435 生物 技术 进展 ,606 管理 世界 ,1 162 
情报 资料 工作 ,672 计算 机 集成 制造 系统 ， 科 技 与 出 版 ,2 487 江苏 高 教 ,1 822 生物 技术 通报 ,2 447 管理 学 报 ,1 466 
数据 分 析 与 知识 发 2050 现代 出 版 ,875 现代 大 学 教育 ,598 生物 技术 通讯 ,996 南开 管理 评论 ,738 
现 ,985 计算 机 科学 ,6 249 现代 传播 ,2 729 中 国 高 等 教育 ,3 164 生物 信息 学 ,252 系统 工程 ,1 260 
图 书 情报 工作 ,3 171 计算 机 学 报 ,1 024 新 闻 大 学 ,781 中 国 高 教研 究 ,1 599 生物 学 杂志 ,1 181 系统 工程 理论 与 实践 ， 
图 书 情报 知识 ,585 计算 机 研究 与 发 展 ， 新闻 记 者 ,1 029 生物 医学 工程 学 杂志 ，2 004 
图 书 与 情报 ,815 1 613 新 闻 与 传播 研究 ,705 1 139 系统 工程 学 报 ,492 
现代 情报 ,2 062 计算 机 应 用 ,5 155 中 国 编辑 ,1 402 中 国生 物 工 程 杂 志 ， 系 统管 理学 报 ,864 
瑟 图 书馆 学 报 ,346 计算 机 应 用 研究 ,5 582 ”中 国 出 版 ,3 244 1 238 运筹 与 管理 ,2 017 
软件 学 报 ,1 541 中 国 科 技 期 刊 研究 ， 中 国 管理 科学 ,1 960 
i 中 国 图 象 图形 学 报 ，1 480 
| 


表 2 学 者 博文 数据 


者 并 标题 时 间 博文 内 容 点 赞 学 者 了 D 


Ce 下 0526 人 入选 2022 年 度 浙江 省 “尖兵 ” 2021/9/29 人 工 智能 组 ,项 目 经 费 都 是 500W/ 项 ,浙江 省 2022 年 度 750818 .107667 
CN “ 领 哄 "研发 攻关 计划 项 目 会 评 “尖兵 “ 领 雁 "研发 攻关 计划 项 目 …… 
© 专家 名 单 


> 【围城 围 谁 的 城 ] 一 一 兼 答 青年 2019/12/14 【围城 围 谁 的 城 ] 一 一 兼 答 青 年 博士 求职 FAQ( 续 ) 自 老 。 325385 425437 1213429…… 

>< 博士 求职 FAQ( 续 ) 刘 上 次 发 文 [围城 围 谁 的 城 ] 一 一 兼 答 青年 博士 求 
/5 PP 

© 

SC 
mm 42 关于 科 ( 医 ) 学 ,来 点 思考 2020/3/10 讨论 一 些 热门 话题 如 中 医 西医 、 转 基因 非 转 基因 ,会 让 5889 .1536597 107667…… 
= 和 谐 相处 的 人 们 站 到 不 同 队列 中 ,科学 知识 具有 社会 和 

© 文化 属性 …… 


五 部 门 关 于 科技 期 刊 的 “ 意 2015/11/26 五 部 门 关 于 科技 期 刊 的 意见” ,从 南京 大 学 开始 试点 。 769161 41701 、1458267…… 
见 ", 从 南京 大 学 开始 试点 如 何 ? 2015 年 11 月 4 日 ,中 国 科 学 技术 协会 .教育 


如 何 ? 部 
表 3 学 者 评论 数据 表 4 学 者 好 友 数 据 
学 者 ID 评论 学 者 了 D 评论 时 间 学 者 好 友 ID 
3410526 1200905 2021/11/23 
pis 3410526 3497110 .3493616 .3492623 .3469996 .3466976.……: 
1213429 2019/12/15 
1835014 3451787 .1898783 .2381229 .475 .1943390……: 
1835014 3436271 2020/12/15 
“0 1037866 425437 .38450 .1350441 .1834487 .2460165……: 
561693 2015/5/22 
a 1213429 60980 .2649160 .669170 .1200905 .729911.……: 
542 107667 2021/8/16 
561693 2015/1/19 542 3408518 .3360562 .3354122 .3316859 .3260634……: 
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表 5 主题 - 词 项 概率 分 布 ( 与 主题 相关 的 10 个 高 概率 词 ) 


Topic 主题 标识 词 项 (与 主题 相关 的 10 个 高 概率 词 ) 
0 新 闻 学 与 传播 学 出 版 ,期 刊 ,中 国 ,发 展 ,传播 .研究 我国. 新闻、 内 容 , 科 技 期 乔 
1 计算 机 科学 算法 方法. 图像. 模型 .提高 .数据 .利用 ,特征 .性 能 实验 结果 
2 图 书 情报 学 研究 分析、 图 书馆 方法, 我国、 领域 ,服务 ,发展 ,数据 ,构建 
3 高 等 教育 学 发 展 .高 校 .学 生 、 大 学 .建设 教育 ,我国 .研究 高 等 教育 教师 
4 管理 科学 与 工程 企业 .研究 .影响 .本 文 市 场 .关系 .模型 ,中国 、 产 品 ,发 现 
5 生物 学 基因 .细胞 .表达 .研究 .蛋白 .检测 .分析 . 方 法 .利用 .构建 
6 common_topic 研究 方法. 模型. 用户 .分 析 . 影 响 \ 信 息 数据, 本文 ,构建 
4.2.2 学 者 的 动态 兴趣 特征 提取 间 ,然后 利用 公式 (6) 计算 出 某 学 科 博 文 的 老化 系数 


通过 公式 (2) 计算 学 者 动态 兴趣 时 间 因 子 , 计 算 | a。 通 过 公式 (7) 计 算 学 者 动态 兴趣 向 量 ,部 分 结果 如 
各 个 学 科 领 域 所 有 博文 从 发 布 到 评论 数 达 到 一 半 的 时 | 表 6 所 示 : 
表 6 学 者 动态 兴趣 向 量 


一 学 者 ID 主题 0 主题 1 主题 2 主题 3 主题 4 主题 5 主题 6 
S3410526 0. 098 54 0. 193 45 0.044 72 0. 022 47 0.351 44 0.021 28 0. 005 94 
L3380532 0. 187 37 0.254 77 0.155 62 0.013 58 0. 100 49 0.011 73 0.021 70 
3388899 0. 166 85 0.266 49 0.214 25 0.013 09 0.083 73 0.013 49 0.017 55 
3334560 0.066 80 0.255 16 0.156 41 0.039 88 0.019 52 0. 004 70 0.317 12 
人 3316383 0.114 68 0.240 16 0.059 93 0. 109 36 0.171 58 0.057 63 0.030 92 

图 
On 0. 262 74 0.185 17 0.022 72 0. 042 25 0. 100 44 0. 045 15 0.035 48 
4GNB 学 者 动态 兴趣 相似 度 计算 博文 相似 度 ,部 分 结果 如 表 7 所 示 : 


尽 基 于 学 者 动态 兴趣 向 量 ,利用 公式 (8) 计算 学 
“ 表 7 动态 兴趣 相似 度 矩 阵 


We 学 者 ID 3410526 3389532 3388899 3334560 3316383 542 
3410526 1 0.722 76 0.661 92 0.393 37 0.86289 ce 0.696 68 
3389532 0.722 76 1 0.986 84 0.682 90 0.87978 oo 0. 882 49 

a =3388899 0.661 92 0.986 84 | 0.695 75 0.83586 ee 0. 803 68 

-S3334560 0.393 37 0.682 90 0.695 75 1 0.62543 ee 0.545 65 
3316383 0. 862 89 0. 879 78 0. 835 86 0.625 43 1 0. 849 15 

542 0.696 68 0. 882 49 0. 803 68 0.545 65 0.84915 ee 1 
4.3 学 者 动态 社交 信任 度 计 算 4.3.2 交互 信任 度 计 算 
4.3.1 全 局 信任 度 计 算 学 者 动态 交互 信任 度 由 学 者 的 点 赞 交互 信任 度 和 
利用 公式 (9 ) 计算 学 者 全 局 信任 度 , 其 中 PageR- | 评论 交互 信任 度 构成 。 点 移交 互信 任 度 利用 公式 
ank 值 通过 Python 计算 得 到 ,同时 考虑 学 者 所 发 博文 | 〈10) 计 算得 到 ,评论 交互 信任 度 利 用 公式 (11 ) 计 算得 
本 身 的 时 间 价 值 ,部 分 结果 如 表 8 所 示 : 到 ,两 者 结合 得 到 学 者 动态 交互 信任 度 ,部 分 结果 见 
表 8 学 者 全 局 信任 度 表 9。 
学 者 ID PageRank 时 间 价 值 全 局 信任 度 4.3.3 动态 社交 信任 度 融合 计算 
3410526 0.405 56 0.006 84 0.412 40 利用 公式 (15) 融合 全 局 信任 度 和 交互 信任 度 计 
3389532 0.061 94 0.031 24 0.093 18 ee EB 
3388899 0.011 30 0.060 12 0.071 42 算 学 者 动态 社交 信任 度 ,结果 见 表 10。 
3334560 0. 101 39 0.438 17 0.539 57 4.4 学 者 推荐 评分 融合 计算 
0 利用 公式 (16) 融合 动态 兴趣 相似 度 和 动态 社交 
542 0.039 42 0. 007 83 0.047 25 信任 度 ,得 到 学 者 最 终 推 荐 评分 ,融合 参数 y 根据 实验 
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表 9 学 者 交互 信任 度 


学 者 ID 3410526 3389532 3388899 3334560 3316383 ee 542 
3410526 1 0 0 0 人 0 
3389532 0 1 0.037 47 0 0 0 0 
3388899 0 0 1 0 En 0 
3334560 0 0 0 1 i 0 
3316383 0.291 06 0 0.027 78 0 Ei 0 
542 0 0 0 0 i 1 


表 10 学 者 动态 社交 信任 度 


学 者 ID 3410526 3389532 3388899 3334560 3316383 542 
3410526 dls 0. 206 20 0.206 20 0.206 20 0.20620 ee 0.206 20 
3389532 0.046 59 0.046 59 0.065 32 0.046 59 0.04659 0.046 59 
3388899 0.035 71 0.035 71 0.802 92 0.035 71 0.03571 0 0.035 71 
于 3334560 0.269 78 0.269 78 0.269 78 0.269 78 0.26978 0.269 78 
D3316383 0.288 34 0.14 281 0.15670 0.142 81 1.661 19 0 0.142 81 


542 0.023 63 0.023 63 363 0.023 63 0.02363 0.391 06 
© 
情况 没 定 ,在 好 友 推荐 结果 评价 中 ,当前 较为 常用 的 评 os 
价 指 标 为 准确 率 (Precision) ,召回 率 ( Recall) 以 及 综合 032 
准确 率 和 召回 率 的 FI-measuref 7) 。 其 公式 如 下 : 0 
OE 克 衬 -推荐 出 的 局 经 丰 为 好 友 的 学 者 数 下 
Go 推荐 正确 的 学 者 数 + 推荐 错误 的 学 者 数 二 040 
> 公式 (17) 
SZ 站 率 = 030 
5 推荐 HH 的 已 经 成 为 好 友 的 学 者 数 lop5 topl0 topl5 top20 lop30 
推荐 正确 的 学 者 数 + 应 该 被 推荐 但 没有 被 推荐 的 学 者 数 二 
二 公式 (18) i 
OF measure = eeen Reel A 式 (19) 图 3 ”融合 参数 y 对 准确 率 的 影响 
实验 比较 了 Y 为 0.5.0.6.0.7 的 三 种 情况 , 当 推 042 
荐 学 者 数量 少 于 15 时 ,y =0.6 效果 最 好 ,推荐 学 者 数 2 
量 超过 15 时 ,y =0.5 效果 最 好 ,结果 见 图 3 -图 5, 本 0 
文 最 终 选 择 y =0.6 进行 评分 融合 ,为 便于 对 后 续 结 ye 
分 析 , 对 角 线 上 的 结果 一 律 设 为 -1, 结 果 见 表 11。 -ee 
0.24 
$5 推荐 结果 分 析 1 
融合 用 户 动态 兴趣 相似 度 和 社交 关系 信任 度 ,最 ou 
终 得 到 推荐 结果 ,部 分 数据 见 表 12。 I 
随机 选取 学 者 3410526 推荐 的 前 5 名 学 者 为 例 进 0 
行 验证 ,可 以 看 出 本 文 提出 的 推荐 模型 可 以 得 到 较 好 Se 
的 推荐 结果 ,学 者 3410526 为 教授 .研究生 导师 ,其 所 
ee 图 4 ”融合 参数 y 对 召回 率 的 影响 
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0.34 

0.32 

0.30 
日 
# 0.28 
三 
守 0.26 

0.24 

0.22 

四 
0.20 
top5 top10 lop15 top20 top30 
推荐 学 者 个 数 
*** Y=-0.5 一 起 一 -0.6 Y=0.7 


图 5 融合 参数 y 对 Fl1-Measure 的 影响 


从 学 者 研究 兴趣 分 析 ,学 者 3410526 发 表 的 博文 

较 多 关注 科学 研究 研究生 教 育 、 博 士 就 业 相关 内 容 。 
学 者 1557 发 表 过 很 多 科学 研究 方面 的 博文 ,例如 “ 像 
打 理 花园 一 样 培育 科研 ”科技 期 刊 在 数字 化 时 代 的 
两 难处 境 “ 文 献计 量 学 与 科技 期 刊 研究 ”等 博文 ;学 
者 425437 发 表 过 很 多 博士 就 业 相 关 的 博文 ,例如 “入 
只 高 校 的 博士 生 ,要 不 要 立马 换 方向 “一 位 博士 生 对 
就 业 选 择 的 困惑 "等 博文 ;学 者 2999994 发 表 过 很 多 研 
究 生 教育 有 关 的 博文 ,例如 标题 为 “导师 和 “只 想 拿 个 
学 位 "的 研究 生 如 何 成 为 命运 共同 体 ?”"“ 如 何 让 导师 
和 研究 生成 为 命运 共同 体 ?” 等 博文 ;学 者 522469 发 表 
了 很 多 研究 生 教 育 和 科学 研究 相关 的 博文 ,例如 “突然 


< 一 表 11 学 者 最 终 推荐 评分 
和 

re 学 者 瑟 3410526 3389532 3388899 3334560 3316383 0 542 
Pe a 一 1 0.516 14 0.479 63 0.318 50 0.60022 0 0.500 49 
下 3389532 0.452 29 一 1 0.618 23 0.428 38 0.54651 0 0.548 13 
[a 0.411 44 0.606 39 一 1 0.431 73 0.51580 0 0.496 49 
全 5334560 0.343 93 0.517 66 0.52S 36 一 1 0.48317 0 0.435 30 
3316383 0.633 07 0.584 99 0.564 19 0.432 38 -1 0.566 62 
©O 542 0.427 46 0.538 94 0.491 66 0.336 84 0.51894 0 一 1 


0 


A 表 12 学 者 推荐 结果 
oa 
GN 六 者 D 推荐 结果 
E3410526 1557 425437 2999994 522469 3316383 .215715 .1213429 .2903646 .401512 .64000 .57940 .3075 、1256692 359436 .652078.……: 
3389532 1557 57940 3075 .2374 .287179 .1968 .826653 .1750 .94143 .290937 .951291 554179 .496649 404304 215715……: 
388899 1557 3075 .2374 .826653 .290937 554179 1968 .951291 496649 .1750 .287179 .2322490 .340399 .94143 .3389532.………. 
(B334560 1557 3075 .290052 .118204 .404304 .571917 508476 .1835014 .2577109 554179 ,787764 .656335 .1125809 707141 .2636671.………: 
C3316383 1557 213646 .3075 .554179 .94143 .287179 215715 1792012 45134 .1750 1213429 .2374 57940 472757 425437.….…… 
i 
bm 542 1557 \3075 .213646 .69474 .61772 .287179 .290052 .1968 ,215715 ,404304 ,45134 .71721 ,576665 .3503 .94143…… 


想 把 课程 内 容 弄 的 好 一 点 “科研 选 大 问题 还 是 选 小 
问题 (科研 生态 中 的 岛屿 效应 )”“ 一 个 科研 领域 的 兴 
衰 一 一 要 不 要 坚守 ?” 等 博文 ;学 者 3316383 发 表 了 很 
多 科学 研究 .论文 撰写 方面 的 博文 ,例如 “如 何在 写 文 
章 时 使 用 学 术 资 源 ? “使 用 文本 挖 据 工具 对 专 有 数据 
库 的 数据 进行 热门 话题 研究 "等 博文 ,这些 都 与 目标 学 


有 考虑 用 户 兴趣 或 社交 行为 的 动态 变化 。 由 于 部 分 学 
者 的 好 友 数 过 少 ,难以 对 推荐 结果 进行 评价 ,所 以 在 结 
果 评 价 时 设 定好 友 数 闷 值 为 10 ,对 高 于 靖 值 的 学 者 进 
行 评价 ,结果 如 图 6 -图 8。 可 以 看 出 ,本 文 方法 推荐 
效果 要 明显 优 于 基于 兴趣 和 基于 兴趣 与 社交 关系 的 推 
存 方 法 。 


者 3410526 的 研究 兴趣 有 很 高 的 相关 性 。 


6 结语 


从 学 者 地 位 和 活跃 度 分 析 ,5 位 推荐 学 者 均 为 高 
校 教授 ,在 所 属 专 业 领域 具备 一 定 的 声望 , 产 出 博文 具 
有 较 高 的 学 术 价值 ,在 虚拟 学 术 社区 中 比较 活跃 。 

为 了 进一步 验证 本 文 所 提出 的 推荐 模型 在 学 者 推 
荐 方面 的 有 效 性 ,参照 好 友 推 荐 的 经 典 方法 ,本 文 比较 
了 基于 兴趣 推荐 .基于 兴趣 与 社交 关系 推荐 和 融合 动 
态 兴 趣 与 社交 关系 推荐 的 三 种 学 者 推荐 算法 的 性 能 ， 
其 中 基于 兴趣 的 推荐 和 基于 兴趣 与 社交 关系 的 推荐 没 


虚拟 学 术 社区 以 科研 工作 者 为 服务 对 象 ,支持 科 
研 人 员 知 识 交流 .共享 和 维护 社交 关系 , 极 大 地 拓宽 了 
传统 意义 上 学 术 交 流 的 途径 ,促进 了 非 正 式 学 术 交 流 
的 发 展 , 对 新 知识 的 创造 .传播 和 不 同学 科 知 识 的 交叉 
渗透 产生 了 重要 影响 。 然 而 ,虚拟 学 术 社区 中 的 注册 
用 户 和 学 术 信息 的 海量 增长 使 得 如 何 帮助 用 户 快速 寻 
找 学 术 水 平 较 高 、 兴 趣 相投 的 学 者 成 为 目前 迫切 需要 
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110 - 120. 
0.60 变化 速率 改进 时 间 因 子 ,兼顾 了 虚拟 学 术 社 区 的 学 术 
0.55 人 wk | 
050 性 、` 社 交 性 和 不 同学 科 特 性 。 结 果 显 示 ,虚拟 学 术 社区 
区 人 中 融合 用 户 动态 兴趣 与 动态 社交 关系 的 学 者 推荐 模型 
035 ms et a ea 有 效 提 
0.30 ~ 
0 3 学 者 推荐 的 质量 。 本 文 研究 也 存在 一 些 不 足 之 
Ml i ne 处 者 评论 交互 信任 度 计 算 时 未 考虑 学 者 回复 行 
推荐 学 者 个 数 为 产生 的 交互 信任 度 , 另 外 也 未 考虑 学 者 之 间 的 间接 
一 ~ 其 于 兴趣 交互 行为 ,这 些 问题 有 待 在 后 续 的 研究 中 进一步 完善 。 
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-人 Abstract: | Purpose/ Significance | Considering the dynamic changes of users ”interests and social relation- 
9 this paper proposes a scholar recommendation model integrating users ”dynamic interests and social relation- 
ships. | Method/Process | Firstly, using the periodical literature of different disciplines as the classified corpus, the 
discipline domain of scholars” blog posts was distinguished based on the labeled LDA model. Then KNN algorithm 
was used to classify blogs by discipline. At the same time, the change rate of subject interests was used to improve 
the time factor, and the dynamic interest similarity of scholars was calculated. The PageRank of scholars was calcu- 
lated by using the quantitative relationship of links between scholars, and the global trust level was calculated by 
combining the PageRank and time value of blogs sent by scholars. Time weight was introduced into scholars” com- 
ments and recommendation interaction behaviors to calculate scholars ”interactive trust level. The dynamic social 
trust level of scholars was obtained by integrating the global trust level and interactive trust level. Finally, the simi- 
larity of interest and trust were combined to recommend scholars. | Result/ Conclusion | The scholar recommendation 
model integrating users ”dynamic interests and social relationships in the virtual academic community can effectively 
improve the quality of scholar recommendation from the perspectives of dynamic interests and dynamic social relation- 
ships. 

Keywords: virtual academic community dynamic interests social connections scholar recommendation La- 
beled-LDA topic model 
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